分层和匹配都是非参数估计方法,并未对数据生成过程作出假设。
定义:
- outcome
- binary treatment
- discrete covariates
考虑如下 Linear Regression Model(省略了规范性条件):
根据 Frisch-Waugh-Lovell Theorem 可知, 也相当于 对 回归的系数。其中, 是 Linear Projection Model 当中的 Projection Error。不过,根据条件期望的定义, 是离散变量就意味着 ,即条件期望函数必然是线性的。因此 ,即 还是 CEF Error,也就满足相关性质。如果 是连续变量,要使用 CEF Error 的相关性质就需要明确假设 关于 是线性的了。
根据 Linear Regression Model#求解参数 可知
利用潜在结果框架,定义
从而有
代入 可得
其中, 是关于 的函数,根据 CEF Error 的性质可知该项为零。
引理:
证明: 定义式两边同时乘上 并取期望可得
其中, 是关于 的函数,根据 CEF Error 的性质可知可知该项为零,第一个等式成立;代入 的定义式即可得到剩余等式。证毕。
引理代入 可得
可见回归被估量 相当于 根据 加权的平均值。其中, 是一个服从二项分布的随机变量,因此 ,于是
对比匹配被估量,使用贝叶斯公式和全概率公式可得
由此可见,回归和匹配都是 的平均值,回归是加权平均值,匹配则是算术平均值。例如, 时 最大,即回归会将最大权重赋予处理组和控制组数量相同的层。
结合潜在结果框架,如果满足强可忽略性假设,则
进一步,如果 为常数(这很困难),则回归和匹配被估量结果完全相同。